Vers l'exploitation de grandes masses de données
نویسندگان
چکیده
Résumé : Une tendance lourde depuis la fin du siècle dernier est l'augmentation exponentielle du volume des données stockées. Cette augmentation ne se traduit pas nécessairement par une information plus riche puisque la capacité à traiter ces données ne progresse pas aussi rapidement. Avec les technologies actuelles, un difficile compromis doit être trouvé entre le coût de mise en œuvre et la qualité de l'information produite. Nous proposons une approche industrielle permettant d'augmenter considérablement notre capacité à transformer des données en information grâce à l'automatisation des traitements et à la focalisation sur les seules données pertinentes.
منابع مشابه
Big Data - Retour vers le Futur 3; De Statisticien à Data Scientist
L'évolution rapide des systèmes d'information gérant des données de plus en plus volumineuses a causé de profonds changements de paradigme dans le travail de statisticien, devenant successivement prospecteur de données, bio-informaticien et maintenant data scientist. Sans souci d'exhaustivité et après avoir illustré ces mutations successives, cet article présente brièvement les nouvelles questi...
متن کاملLarge-scale acoustic and prosodic investigations of french. (Analyses acoustiques et prosodiques du français à partir de grandes masses de données orales)
ii This thesis was partially financed by RTRA-DIGITEO, Région Île-de-France, under the projet AMADEO (Apprentissage à partir de grandes masses de données orales, 2007-01D), and by the OSEO Quaero program.
متن کاملExploitation de l'échelle d'écriture pour améliorer la reconnaissance automatique des textes manuscrits arabe
RÉSUMÉ. Les documents manuscrits arabes présentent des défis spécifiques pour la reconnaissance du fait de la nature de l'écriture cursive et d'autres facteurs, comme la taille de l'écriture. Une des plus grandes bases étiquetées des documents manuscrits arabes, la base de données NISTOpenHaRT inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons ...
متن کاملRôle et techniques de l'alignement d'ontologies : un survol de l'état de l'art
Le besoin d’intégrer et d’analyser des grandes masses est présent dans de nombreux domaines d’applications. Le problème de l’alignement d’ontologies/schémas dont le résultat est un ensemble de correspondances entre différentes représentations du monde réel, est au centre du processus d’intégration des données. En effet, l’intégration de données est motivée par la forte hétérogénéité des données...
متن کاملVisualisation de graphes avec Tulip : exploration interactive de grandes masses de données en appui à la fouille de données et à l'extraction de connaissances
LaBRI UMR 5800 Université Bordeaux I 351 Cours de la Libération 33405 Talence Cedex – France {auber,maylis,domenger,mary}@labri.fr www.labri.fr Département de mathématiques et d’informatique Université du Québec à Chicoutimi 555, boulevard de l’Université Chicoutimi, G7H 2B1 – Canada [email protected] wwwdim.uqac.ca INRIA Futurs & LIRMM UMR 5506 161 rue Ada 34392 Montpellier Cedex 5 – Fran...
متن کامل